Découverte de proportions analogiques dans les bases de données : une première approche

نویسندگان

  • William Correa Beltran
  • Hélène Jaudoin
  • Olivier Pivert
چکیده

Résumé. Cet article présente un nouveau cadre pour la découverte de connaissances basé sur la notion de proportion analogique qui exprime l’égalité des rapports entre les attributs de deux paires d’éléments. Cette notion est développée dans le contexte des bases de données pour découvrir des parallèles dans les données. Dans un premier temps, nous donnons une définition formelle des proportions analogiques dans le cadre des bases de données relationnelles, puis nous étudions le problème de l’extraction des proportions analogiques. Nous montrons qu’il est possible de suivre une approche de clustering pour découvrir les classes d’équivalence de paires de n-uplets dans le même rapport de proportion analogique. Ce travail constitue une première étape vers l’extension des langages d’interrogation de base de données avec des requêtes « analogiques ».

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

C-SAKey : une approche de découverte de clés conditionnelles dans des données RDF

Résumé : L’exploitation des liens d’identité entre ressources RDF permet aux applications de combiner des données issues de différentes sources. Les approches permettant de lier des données sont largement fondées sur l’existence de clés éventuellement composites. Ces clés étant rarement disponibles, des approches récentes se sont intéressées à la découverte automatique de clés à partir de donné...

متن کامل

Graphes de voisinage pour l'indexation et l'interrogation d'images par le contenu

Résumé. La découverte d’informations cachées dans les bases de données multimédias est une tâche difficile à cause de leur structure complexe et à la subjectivité liée à leur interprétation. Face à cette situation, l’utilisation d’un index est primordiale. Un index multimédia permet de regrouper les données selon des critères de similarité. Nous proposons dans cet article d’apporter une amélior...

متن کامل

Techniques de fouille de données pour la réécriture de requêtes en présence de contraintes de valeurs

Résumé. Dans cet article, nous montrons comment les techniques de fouilles de données peuvent résoudre efficacement le problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. A partir d’une formalisation du problème de la réécriture dans le cadre de la logique de description ALN (Ov), nous montrons comment ce problème se rattache à un cadre de découverte d...

متن کامل

Modélisation d'objets mobiles dans un entrepôt de données

Résumé. La gestion d’objets mobiles a connu un regain d’intérêt ces dernières années, particulièrement dans le but de gérer et de prédire la localisation d’objets mobiles. Cependant, il y a peu de recherches sur l’exploitation d’historiques de bases d’objets mobiles. La première étape dans ce processus est la mise en œuvre d’un entrepôt d’objets mobiles. Seulement, les modèles d’entrepôts exist...

متن کامل

Forage distribué des données : une comparaison entre l'agrégation d'échantillons et l'agrégation de règles

Résumé. Pour nous attaquer au problème du forage de très grandes bases de données distribuées, nous proposons d’étudier deux approches. La première est de télécharger seulement un échantillon de chaque base de données puis d’y effectuer le forage. La deuxième approche est de miner à distance chaque base de données indépendamment, puis de télécharger les modèles résultants, sous forme de règles ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015